Google Search Console に、当サイトへの見慣れない被リンク( バックリンク )が大量にあるのを発見、 否認 ツールを使ってこのような スパム バックリンク を全て 否認 してSEO改善、ぱっとしないPV改善を臨みます。
バックリンクサイトリストのダウンロード
Google Search Consoleの リンク ページで、外部から貼られているリンクを確認することができます。ページ右上の 外部リンクをエクスポート より、
最新のリンク リストをCSV形式でダウンロードすると、見慣れない海外サイトのURLがずらり。
ドメイン単位で対策を講じようと思うので、 上位のリンク元サイト の 詳細 をクリックして、そこで エクスポート ボタンを押してCSVファイル( servercan.net-Top linking sites-2023-12-20.csv )を取得しました。
中身はカンマ区切りのCSVなので、 awk を使ってその左端フィールドを抜き出せば、ドメインリスト( domains.txt )が得られます。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
$ ls -l -rw-rw-r-- 1 user user 16215 Dec 20 14:44 'servercan.net-Top linking sites-2023-12-20.csv' $ head -n 5 servercan.net-Top\ linking\ sites-2023-12-20.csv サイト,リンクしているページ,ターゲット ページ togetter.com,2095,1 wppenergy.io,557,2 muragon.com,263,51 rhombex.com,178,2 $ awk -F',' '{print $1}' servercan.net-Top\ linking\ sites-2023-12-20.csv > domains.txt $ ls -l -rw-rw-r-- 1 user user 16215 Dec 20 14:44 'servercan.net-Top linking sites-2023-12-20.csv' -rw-rw-r-- 1 user user 13031 Dec 20 15:27 domains.txt $ head -n 5 domains.txt サイト togetter.com wppenergy.io muragon.com rhombex.com |
Google Search Console リンクの否認
Google Search Consoleには、本意ではないスパムリンクを否認報告できるページが用意されていますが、安易に使ってもらいたくないのか、Google Search Consoleからはリンクが辿れません。
用意されているヘルプドキュメントを読み砕くと、否認したいページやドメインを1行1レコードのテキストファイルの形でアップロードすれば良いのだそう。
ドメイン単位で否認する場合は、ドメイン名の前に domain: というプレフィックスを付与する必要があります。
否認リストの作成
ダウンロードしたCSVから生成したドメインリストには、健全なサイトも含まれているので、初回は一つ一つ確認しながら仕分けます。今後に備え、健全なサイトリスト( domains_safe.txt )も消さずに保存しておきました。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
domains.txt : 771 sites ├─> domains_deny.txt : 737 sites └─> domains_safe.txt : 34 sites $ head -n 5 domains_deny.txt wppenergy.io rhombex.com alteregobkk.com uksolarservice.co.uk yanisac.com $ head -n 5 domains_safe.txt サイト togetter.com muragon.com ggmokkou.com 5ch.net |
目視によるフィルタリングを終えたら sed コマンドを使って、スパムサイトリストと化したテキストファイル( domains_deny.txt )の各行頭に、 domain: プレフィックスを付与した別ファイル( denies.txt )を生成します。
1 2 3 4 5 6 7 8 |
$ sed "s/^/domain:/g" ./domains_deny.txt > denies.txt $ head -n 5 denies.txt domain:wppenergy.io domain:rhombex.com domain:alteregobkk.com domain:uksolarservice.co.uk domain:yanisac.com |
否認リストのアップロード
Google Search Consoleのリンクの否認ページを開き、まずは対象となるプロパティを選択。
但し、ドメインプロパティには未対応。
http や https の個別プロパティを選択したら、否認リストをアップロードをクリックして、予め作成したテキストファイル( denies.txt )をアップロードします。
アップロードが完了しても、その日時を示す文言が表示されるだけ。実際に次回のクロール時に反映されるまで、1ヶ月近く掛かるようです。
別途、メールでも否認ファイルのアップロードについての通知が届きます。
次ページでは、一ヶ月後の状態確認と、更新作業の省工程化に取り組みます。